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^ eCGcSJAATTGCCGGAATTGCTCACCTGAAGACG 120 

r^l^GGCGGAAGATGGGTCAGCTTGGGCTTGAGG^ 100 

r^GTTGTTOlTTGGGA^^ 240 

1*^ ^?^5^;GGTCTGGCTCT^ 300 

CXGAGAGAT^ 360 

arC^CGTGGTGAAATTTGGAACTTTTAAGAGGCAGATAGATTT 420 
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1 ATG AAT GGT CTC GAA ACT CAC AAC ACA AGG CTC TGT ATC GTA GGA AGT GGC CCA GCG GCA 60 

IMNGLETHNTRLCIVGSGPAA 20 
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421 AAC CGT GGA ATC TCC GCT TGT GCT GTT TGC GAC GGA GCT GCT CCG ATA TTC CGT AAC AAA 480 

141 NRGISACAVCDGAAPIFRNK 160 

481 CCT CTT GCG GTG ATC GGT GGA GGC GAT TCA GCA ATG GAA GAA GCA AAC TTT CTT ACA AAA 540 
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601 CAG CAG CGA GCT TTG TCT AAT CCT AAG ATT GAT GTG ATT TGG AAC TCG TCT GTT GTG GAA 660 

201 QQRALSNPKIDVIWNSSVVE 220 

651 GCT TAT GGA GAT GGA GAA AGA GAT GTG CTT GGA GGA TTG AAA GTG AAG AAT GTG GTT ACC 720 

221 AYGDGERDVLGGLKVKNVVT 240 

721 GGA GAT GTT TCT GAT TTA AAA GTT TCT GGA TTG TTC TTT GCT ATT GGT CAT GAG CCA GCT 780 

241 GDVSDLKVSGLFFAIGHEPA 260 

781 ACC AAG TTT TTG GAT GGT GGT GTT GAG TTA GAT TCG GAT GGT TAT GTT GTC ACG AAG CCT 840 

261 TKFLDGGVELDSDGYVVTKP 280 

841 GGT ACT ACA CAG ACT AGC GTT CCC GGA GTT TTC GCT GCG GGT GAT GTT CAG GAT AAG AAG 900 

281 GTTQTSVPGVFAAGDVQDKK 300 

901 TAT AGG CAA GCC ATC ACT GCT GCA GGA ACT GGG TGC ATG GCA GCT TTG GAT GCA GAG CAT 960 

301 YRQAITAAGTGCMAALDAEH 320 

961 TAG TTA CAA GAG ATT GGA TCT CAG CAA GGT AAG AGT GAT TGA 1002 

321 YLQEIGSQQGKSD* 334 
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PstI 

l_ctacaggaattcattgtactcccagtatcattatagtgaaagttttggctctctcgccggtggttttttacctctattta 80 
81 aaggggttttccacctaaaaattctggtatcattctcactttacttgttactttaatttctcataatctttggttgaaat 160 
161 tatcacgcttccgcacacgatatccctacaaatttattatttgttaaacattttcaaaccgcataaaattttatgaagtc 240 
241 ccgtctatctttaatgtagt ctaacatt ttcatattgaaatatataatttacttaattttagcgttggtagaaagcataa 32 0 
321 tgatttattcttattcttcttcatataaatgtttaatatacaatataaacaaattctttaccttaagaaggatttcccat 400 
401 tttatattttaaaaatatatttatcaaatatttttcaaccacgtaaatctcataataataagttgtttcaaaagtaataa 480 
481 aatttaactccataatttttttattcgactgatcttaaagcaacacccagtgacacaactagccatttttttctttgaat 560 
561 aaaaaaatccaattatcattgtattttttttatacaatgaaaatttcaccaaacaatcatttgtggtatttctgaagcaa 640 
641 gtcatgttatgcaaaattctataattcccatttgacactacggaagtaactgaagatctgcttttacatgcgagacacat 720 
721 cttctaaagtaattttaataatagttactatattcaagatttcatatatcaaatactcaatattacttctaaaaaattaa 800 
801 ttagatataattaaaatattacttttttaattttaagtttaattgttgaatttgtgactattgatttattattctactat 880 
881 gtttaaattgttttatagatagtttaaagtaaatataagtaatgtagtagagtgttagagtgttaccctaaaccataaac 960 
961 tataagatttatggtggactaattttcatatatttcttattgcttttaccttttcttggtatgtaagtccgtaactggaa 1040 
1041 ttactgtgggttgccatggcactctgtggtcttttggttcatgcatggatgcttgcgcaagaaaaagacaaagaacaaag 112 0 
1121 aaaaaagacaaaacagagagacaaaacgcaatcacacaaccaactcaaattagtcactggctgatcaagatcgccgcgtc 1200 
1201 catgtatgtctaaatgccatgcaaagcaacacgtgcttaacatgcactttaaatggctcacccatctcaacccacacaca 1280 
1281 aacacattgcctttttcttcatcatcaccacaaccacctgtatatattcattctcttccgccacctcaatttcttcactt 1360 
1361 caacacacgtcaacctgcatatgcgtgtcatcccatgcccaaatctccatgcatgttccaaccaccttctctcttatata 1440 
1441 atacctataaatacctctaatatcactcacttctttcatcatccatccatccagagtactactactctactactataata 1520 

1521 ccccaacccaactcatattcaatactactctact ATG GCT TCG GAA GAA GGA CAA GTG ATC GCC TGC 1587 
^ MASEEGQVIACll 

1588 CAC ACC GTT GAG ACA TGG AAC GAG CAG CTT CAG AAG GCT AAT GAA TCC AAA ACT CTT GTG 1647 
^^HTVETWNEQLQKAKESKTLV 31 

1648 GTG GTT GAT TTC ACG GCT TCT TGG TGT GGA CCA TGT CGT TTC ATC GCT CCA TTC TTT GCT 1707 
32VVDFTASWCGPCRFIAPFFA 51 

1708 GAT TTG GCT AAG AAA CTT CCT AAC GTG CTT TTC CTC AAG GTT GAT ACT GAT GAA TTG AAG 1767 
52DLAKKLPNVLFLKVDTDELK 71 
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1768 TCG GTG GCA AGT GAT TGG GCG ATA CAG GCG ATG CCA ACC TTC ATG TTT TTG AAG GAA GGG 1827 
72SVASDWAIQAMPTFMFLKEG 91 

1828 AAG ATT TTG GAC AAA GTT GTT GGA GCC AAG AAA GAT GAG CTT CAG TCT ACC ATT GCC AAA 1887 

92KILDKVVGAKKDELQSTIAK 111 

Hindu I 

1888 CAC TTG GCT TAA^_acttaataagtatgaactaaaatgcat:gtaggtgtaagagctcatggagagcatggaatatt:gt 1963 
112 H L A * 

1964 atccgaccatgtaacagtataataactgagctccatctcacttcttctatgaataaacaaaggatgttatgatatattaa 2043 
2044 cactctatctatgcaccttattgttctatgataaatttcctcttattattataaatcatctgaatcgtgacggcttatgg 2123 
2124 aatgcttcaaatagtacaaaaacaaatgtgtactataagactttctaaacaattctaactttagcattgtgaacgagaca 2203 
2204 taagtgttaagaagacataacaattataatggaagaagtttgtctccatttatatattatatattacccacttatgtatt 2283 
2284 atattaggatgttaaggagacataacaattataaagagagaagtttgtatccatttatatattatatactacccatttat 2363 
2364 atattatacttatccacttatttaatgtctttataaggtttgatccatgatatttctaatattttagttgatatgtatat 2443 
2444 gaaagggtactatttgaactctcttactctgtataaaggttggatcatccttaaagtgggtctatttaattttattgctt 2523 
2524 cttacagataaaaaaaaaattatgagttggtttgataaaatattgaaggatttaaaataataataaataataaataacat 2603 
2604 ataatatatgtatataaatttattataatataacatttatctataaaaaagtaaatattgtcataaatctatacaatcgt 2683 
2684 ttagccttgctggacgactctcaattatttaaacgagagtaaacatatttgactttttggttatttaacaaattattatt 2763 
2764 taacactatatgaaattttttttttttatcggcaaggaaataaaattaaattaggagggacaatggtgtgtcccaatcct 2843 
2844 tatacaaccaacttccacaggaaggtcaggtcggggacaacaaaaaaacaggcaagggaaattttttaatttgggttgtc 2923 
2924 ttgtttgctgcataatttatgcagtaaaacactacacataacccttttagcagtagagcaatggttgaccgtgtgcttag 3003 
3004 cttcttttattttatttttttatcagcaaagaataaataaaataaaatgagacacttcagggatgtttcaacccttatac 3083 

3084 aaaaccccaaaaacaagtttcctagcaccctaccaactaag gtacc 3129 

Kpni 
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PstI 

l_ctacaggaattcattgtactcccagtatcattatagtgaaagttttggctctctcgccggtggttttttacctctattta 80 

81 aaggggttttccacctaaaaattctggtatcattctcactttacttgttactttaatttictcataatctttggttgaaat 160 

161 tatcacgcttccgcacacgatatccctacaaatttattatt:tgttaaacattt.tcaaaccgcataaaattttatgaagtc 240 

241 ccgtctatctttaatgtagtctaacattttcatattgaaatatataatttacttaattttagcgttggtagaaagcataa 320 

321 tgatttattcttattcttcttcatataaatgtttaatatacaatataaacaaattctttaccttaagaaggatttcccat 400 

401 tt:t;at.att.t:t;aaaaatat>atttat;caaatat:ttttcaaccacgtaaat:ctcataataat;aagttgtttcaaaagtaataa 480 

481 aatttaactccataatttttttattcgactgatcttaaagcaacacccagtgacacaactagccatttttttctttgaat 560 

561 aaaaaaatccaat tat cat tgtattttt tttatacaatgaaaatttcaccaaacaatcatttgtggt atttctgaagcaa 64 0 

641 gtcatgttatgcaaaattctataattcccatttgacactacggaagtaactgaagatctgcttttacatgcgagacacat 720 

721 cttctaaagtaattttaataatagttactatattcaagatttcatatatcaaatactcaatattacttctaaaaaattaa 800 

801 ttagatataattaaaatattacttttttaattttaagtttaattgttgaatttgtgactattgatttattattctactat 880 

881 gtttaaattgttttatagatagtttaaagtaaatataagtaatgtagtagagtgttagagtgttaccctaaaccataaac 960 

961 tataagatttatggtggactaattttcatatatttcttattgcttttaccttttcttggtatgtaagtccgtaactggaa 1040 

1041 ttactgtgggttgccatggcactctgtggtcttttggttcatgcatggatgcttgcgcaagaaaaagacaaagaacaaag 1120 

1121 aaaaaagacaaaacagagagacaaaacgcaatcacacaaccaactcaaattagtcactggctgatcaagatcgccgcgtc 1200 

1201 catgtatgtctaaatgccatgcaaagcaacacgtgcttaacatgcactttaaatggcteacccatctcaacccacacaca 1280 

1281 aacacattgcctttttcttcatcatcaccacaaccacctgtatatattcattctcttccgccacctcaatttcttcactt 1360 

1361 caacacacgtcaacctgcatatgcgtgtcatcccatgcccaaatctccatgcatgttccaaccaccttctctcttatata 1440 

1441 atacctataaatacctctaatatcactcacttctttcatcatccatccatccagagtactactactctactactataata 152 0 

1521 ccccaacccaactcatattcaatactactctact ATG 6C6 GAT ACA OCT AGA GGA ACC CAT CAC GAT 1587 
1 MADTARGTHHDll 

1588 ATC ATC GGC AGA GAC CAG TAG CCG ATG ATG GGC CGA GAC CGA GAC CAG TAC CAG ATG TCC 1647 
12IIGRDQYPUMGRDRDQYQMS 31 

1648 GGA CGA GGA TCT GAC TAC TCC AAG TCT AGG CAG ATT GCT AAA GCT GCA ACT GCT GTC ACA 1707 
32GRGSDYSKSRQIAKAATAVT 51 

1708 GCT GGT GGT TCC CTC CTT GTT CTC TCC AGC CTT ACC CTT GTT GGA ACT GTC ATA GCT TTG 1767 
52AGGSLLVLSSLTLV6TVIAL 71 
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1768 ACT GTT 6CA ACA CCT CTG CTC GTT ATC TTC A6C CCA ATC CTT GTC CCG GCT CTC ATC ACA 1827 
^^^VATPLLVIFSPILVPALIT 91 

1828 GTT 6CA CTC CTC ATC ACC GGT TTT CTT TCC TCT GGA GGG TTT GGC ATT GCC GCT ATA ACC 1887 
92VALLITGFLSSGGFGIAAIT 111 

1888 GTT TTC TCT TGG ATT TAG AA fftaafircacacatttatcatct tacttcataattttfftffcaatatfffcffcat^ca 1960 
112 V F S W I Y K 

1961 tsrtffttffafircca^taffctttg^gatcaatttttttOTtcffaafcaacaaatsrfcaacaataa^aaattffcaaattctaffff^aa 2040 
2041 t^atttsr^ttaacrtaaataeffaaatttsracctaffcta^cttffaatfftflrtctflrtfftatatcatetatatag-fftaaaatffctt 2120 

2121 fffftatgatAcctattgattgtgaatasr G TAC GCA ACG GGA GAG CAC CCA CAG GGA TCA GAC AAG 2184 

Y A T G E H P Q G S D K 130 

2185 TTG GAC AGT GCA AGG ATG AAG TTG GGA AGC AAA GCT CAG GAT CTG AAA GAC AGA GCT CAG 2244 
131LDSARMKLGSKAQDLKDRAQ 150 

2245 TAC TAC GGA CAG CAA CAT ACT GGT GGG GAA CAT GAC CGT GAC CGT ACT CGT GGT GGC CAG 2304 

151YYGQQHTGGEHDR0RTRGGQ 170 

NCOI 

2305 CAC ACT ACC ATG GCT TCG GAA GAA GGA CAA GTG ATC GCC TGC CAC ACC GTT GAG ACA TGG 2364 

171HTTMASEEGQVIACHTVETW 190 

2365 AAC GAG CAG CTT CAG AAG GCT AAT GAA TCC AAA ACT CTT GTG GTG GTT GAT TTC ACG GCT 2424 
191NEQLQKANESKTLVVVDFTA 210 

2425 TCT TGG TGT GGA CCA TGT CGT TTC ATC GCT CCA TTC TTT GCT GAT TTG GCT AAG AAA CTT 2484 
211SWCGPCRFIAPPFADLAKKL 230 

2485 CCT AAC GTG CTT TTC CTC AAG GTT GAT ACT GAT GAA TTG AAG TCG GTG GCA AGT GAT TGG 2544 
231PNVLFLKVDTDELKSVASDW 250 

2545 GCG ATA CAG GCG ATG CCA ACC TTC ATG TTT TTG AAG GAA GGG AAG ATT TTG GAC AAA GTT 2 604 
251AIQAMPTFMFLKEGKILDKV 270 

2605 GTT GGA GCC AAG AAA GAT GAG CTT CAG TCT ACC ATT GCC AAA CAC TTG GCT TAA qctt aata 2666 
271VGAKKDELQSTIAKHLA* 288 

2667 agtatgaactaaaatgcatgtaggtgtaagagctcatggagagcatggaatattgtatccgaccatgtaacagtataata 2746 

2747 actgagct ccatctcacttcttctatgaataaacaaaggatgttatgatatattaacactctatctatgcaccttattgt 2 82 6 

2827 tctatgataaatttcctcttattattataaatcatctgaatcgtgacggcttatggaatgcttcaaatagtacaaaaaca 2906 

2907 aatgtgtactataagactttctaaacaattctaactttagcattgtgaacgagacataagtgttaagaagacataacaat 2986 

2987 t ataat ggaagaagt tt gt ct ccatt tatat att at atat tacccact tatgtattatattaggatgttaaggagacata 3066 
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3067 acaattataaagagagaagtttgtatccatttatatattatatactacccatttatatattatacttatccacttattta 3146 

3147 atgtctttataaggtttgatccatgatatttctaatattttagttgatatgtatatgaaagggtactatttgaactctct 3226 

3227 tactctgtataaaggttggatcatccttaaagtgggtctatttaattttattgcttcttacagataaaaaaaaaattatg 3306 

3307 agttggtttgataaaatattgaaggatttaaaataataataaataataaataacatataatatatgtatataaatttatt 3386 

3387 ataatataacatttatctataaaaaagtaaatattgtcataaatctatacaatcgtttagccttgctggacgactctcaa 3466 

3467 ttatttaaacgagagtaaacatatttgactttttggttatttaacaaattattatttaacactatatgaaattttttttt 3546 

3547 tttatcggcaaggaaataaaattaaattaggagggacaatggtgtgtcccaatccttatacaaccaacttccacaggaag 3626 

3627 Stcaggtcggggacaacaaaaaaacaggcaagggaaattttttaatttgggttgtcttgtttgctgcataatttatgcag 3706 

3707 taaaacactacacataacccttttagcagtagagcaatggttgaccgtgtgcttagcttcttttattttatttttttatc 3786 

3787 agcaaagaataaataaaataaaatgagacacttcagggatgtttcaacccttatacaaaaccccaaaaacaagtttccta 3866 
3867 gcaccctaccaactaa ggtacc 

^ o 8 o 
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1 ctacaggaattcattgtactcccagtatcattatagtgaaagttttggctctctcgccggtggttttttacctctattta 80 
81 aaggggttttccacctaaaaattctggtatcattctcactttacttgttactttaatttctcataatctttggttgaaat 160 
161 tatcacgcttccgcacacgatatccctacaaatttattatttgttaaacattttcaaaccgcataaaattttatgaagtc 240 
241 ccgtctatctttaatgtagtctaacattttcatattgaaatatataatttacttaattttagcgttggtagaaagcataa 320 
321 tgatttattcttattcttcttcatataaatgtttaatatacaatataaacaaattctttaccttaagaaggatttcccat 400 
401 tttatattttaaaaatatatttatcaaatatttttcaaccacgtaaatctcataataataagttgtttcaaaagtaataa 480 
481 aatttaactccataatttttttattcgactgatcttaaagcaacacccagtgacacaactagccatttttttctttgaat 560 
561 aaaaaaatccaattatcattgtattttttttatacaatgaaaatttcaccaaacaatcatttgtggtatttctgaagcaa 640 
641 gtcatgttatgcaaaattctataattcccatttgacactacggaagtaactgaagatctgcttttacatgcgagacacat 720 
721 cttctaaagtaattttaataatagttactatattcaagatttcatatatcaaatactcaatattacttctaaaaaattaa 800 
801 ttagatataattaaaatattacttttttaattttaagtttaattgttgaatttgtgactattgatttattattctactat 880 
881 gtttaaattgttttatagatagtttaaagtaaatataagtaatgtagtagagtgttagagtgttaccctaaaccataaac 960 
961 tataagatttatggtggactaattttcatatatttcttattgcttttaccttttcttggtatgtaagtccgtaactggaa 1040 
1041 ttactgtgggttgccatggcactctgtggtcttttggttcatgcatggatgcttgcgcaagaaaaagacaaagaacaaag 1120 
1121 aaaaaagacaaaacagagagacaaaacgcaatcacacaaccaactcaaattagtcactggctgatcaagatcgccgcgtc 1200 
1201 catgtatgtctaaatgccatgcaaagcaacacgtgcttaacatgcactttaaatggctcacccatctcaacccacacaca 1280 
1281 aacacattgcctttttcttcatcatcaccacaaccacctgtatatattcattctcttccgccacctcaatttcttcactt 1360 
1361 caacacacgtcaacctgcatatgcgtgtcatcccatgcccaaatctccatgcatgttccaaccaccttctctcttatata 1440 
1441 atacctataaatacctctaatatcactcacttctttcatcatccatccatccagagtactactactctactactataata 1520 

1521 ccccaacccaactcatattcaatactactctact ATG GCT TCG GAA GAA GGA CAA GTG ATC GCC TGC 1587 
1 MASEEGQVIACll 

1588 CAC ACC GTT GAG AC A TGG AAC GAG CAG CTT GAG AAG GCT AAT GAA TCC AAA ACT CTT GTG 1647 
^^HTVETWNEQLQKANESKTLV 31 

1648 GTG GTT GAT TTC ACG GCT TGT TGG TGT GGA CCA TGT CGT TTC ATC GCT CCA TTC TTT GCT 1707 
32VVDFTASWCGPCRFIAPFFA 51 

1708 GAT TTG GCT AAG AAA CTT CCT AAC GTG CTT TTC CTC AAG GTT GAT ACT GAT GAA TTG AAG 1767 
52DLAKKLPNVLFLKVDTDELK 71 
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1768 TCG GTG GCA AGT GAT TGG GCG ATA CAG GCG ATG CCA ACC TTC ATG TTT TTG AAG GAA GGG 1827 

72SVASDWAIQAMPTFMFLKEG 91 

1828 AAG ATT TTG GAC AAA GTT GTT GGA GCC AAG AAA GAT GAG CTT CAG TCT ACC ATT GCC AAA 1887 

92 KI LDKVVGAKKDELQSTIAK 111 

1888 CAC TTG GCT ATG GCG GAT ACA GCT AGA GGA ACC CAT CAC GAT ATC ATC GGC AGA GAC CAG 1947 

112 HLAMADTARGTHHDI IGRDQ 131 

1948 TAG CCG ATG ATG GGC CGA GAC CGA GAC CAG TAG CAG ATG TCC GGA CGA GGA TCT GAC TAG 2007 

132 YPMMGRDRDQYQMSGRGSDY 151 

2 008 TCC AAG TCT AGG CAG ATT GCT AAA GCT GCA ACT GCT GTC ACA GCT GGT GGT TCC CTC CTT 2 067 

152 SKSRQIAKAATAVTAGGSLL 171 

2068 GTT CTC TCC AGC CTT ACC CTT GTT GGA ACT GTC ATA GCT TTG ACT GTT GCA ACA CCT CTG 2127 

172 VLSSLTLVGTVIALTVATPL 191 

2128 CTC GTT ATC TTC AGC CCA ATC CTT GTC CCG GCT CTC ATC ACA GTT GCA CTC CTC ATC ACC 2187 

192 LVI FSPILVPALITVALLIT 211 

2188 GGT TTT CTT TCC TCT GGA GGG TTT GGC ATT GCC GCT ATA ACC GTT TTC TCT TGG ATT TAC 2247 

212 GFLSSGGFGIAAITVFSWIY 231 

2248 AA gtaagc^cacatttatcatcttacttcataattttgtgcaatatgtgcatgcatgtgttgagccagtagctttggat 2326 

232 K 232 

2327 caatttttttggtcgaataacaaatgtaacaataagaaattgcaaattctagggaacatttggttaactaaatacgaaat 2406 

2407 ttgacctagctagcttgaatgtgtctgtgtatatcatctatataggtaaaatgcttggtatgatacctattgattgtgaa 24 86 

2487 tag G TAC GCA ACG GGA GAG CAC CCA CAG GGA TCA GAC AAG TTG GAC AGT GCA AGG ATG 2544 

233 YATGEHPQGSDKLDSARM 250 

2 545 AAG TTG GGA AGC AAA GCT CAG GAT CTG AAA GAC AGA GCT CAG TAC TAC GGA CAG CAA CAT 2604 

251KLGSKAQDLKDRAQYYGQQH 270 

Hindu I 

2 605 ACT GGT GGG GAA CAT GAC CGT GAC CGT ACT CGT GGT GGC CAG CAC ACT ACT T AA qctt aata 2666 

271 TGGEHDRDRTRGGQHTT * 288 

2667 agtatgaactaaaatgcatgtaggtgtaagagctcatggagagcatggaatattgtatccgaccatgtaacagtataata 274 6 

2747 actgagctccatctcacttcttctatgaataaacaaaggatgttatgatatattaacactctatctatgcaccttattgt 2826 

282 7 tctatgataaatttcctcttattattataaatcatctgaatcgtgacggcttatggaatgcttcaaatagtacaaaaaca 2906 

29 07 aatgtgtactataagactttctaaacaattctaactttagcattgtgaacgagacataagtgttaagaagacataacaat 29 86 



2987 tataatggaagaagtttgtctccatttatatattatatattacccacttatgtattatattaggatgttaaggagacata 3066 
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3 0 67 acaattataaagagagaagtttgtatccatttatatattatatactacccatttatatattatacttatccacttattta 3146 

3147 atgtctttataaggtttgatccatgatatttctaatattttagttgatatgtatatgaaagggtactatttgaactctct 3 22 6 

3227 tactctgtataaaggttggatcatccttaaagtgggtctatttaattttattgcttcttacagataaaaaaaaaattatg 33 06 

33 07 agttggtttgataaaatattgaaggatttaaaataataataaataataaataacatataatatatgtatataaatttatt 33 86 

3387 ataatataacatttatctataaaaaagtaaatattgtcataaatctatacaatcgtttagccttgctggacgactctcaa 34 66 

3467 ttatttaaacgagagtaaacatatttgactttttggttatttaacaaattattatttaacactatatgaaattttttttt 3 546 

3547 tttatcggcaaggaaataaaattaaattaggagggacaatggtgtgtcccaatccttatacaaccaacttccacaggaag 3 626 

3 627 gtcaggtcggggacaacaaaaaaacaggcaagggaaattttttaatttgggttgtcttgtttgctgcataatttatgcag 3706 

3 707 taaaacactacacataacccttttagcagtagagcaatggttgaccgtgtgcttagcttcttttattttatttttttatc 37 86 

3 787 agcaaagaataaataaaataaaatgagacacttcagggatgtttcaacccttatacaaaaccccaaaaacaagtttccta 3866 

3 867 acaccctaccaactaa aatacc 3 888 
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PstI 

1 ctqcaq gaattcattgtactcccagtatcattatagtgaaagttttggctctctcgccggtggttttttacctctattta 8 0 
81 aaggggttttccacctaaaaattctggtatcattctcactttacttgttactttaatttctcataatctttggttgaaat 160 
161 tatcacgcttccgcacacgatatccctacaaatttattatttgttaaacattttcaaaccgcataaaattttatgaagtc 240 
241 ccgtctatctttaatgtagtctaacattttcatattgaaatatataatttacttaattttagcgttggtagaaagcataa 320 
321 tgatttattcttattcttcttcatataaatgtttaatatacaatataaacaaattctttaccttaagaaggatttcccat 400 
401 tttatattttaaaaatatatttatcaaatatttttcaaccacgtaaatctcataataataagttgtttcaaaagtaataa 480 
481 aatttaactccataatttttttattcgactgatcttaaagcaacacccagtgacacaactagccatttttttctttgaat 560 
5 61 aaaaaaatccaattatcattgtattttttttatacaatgaaaatttcaccaaacaatcatttgtggtatttctgaagcaa 640 
641 gtcatgttatgcaaaattctataattcccatttgacactacggaagtaactgaagatctgcttttacatgcgagacacat 72 0 
721 cttctaaagtaattttaataatagttactatattcaagatttcatatatcaaatactcaatattacttctaaaaaattaa 800 
801 ttagatataattaaaatattacttttttaattttaagtttaattgttgaatttgtgactattgatttattattctactat 880 
881 gtttaaattgttttatagatagtttaaagtaaatataagtaatgtagtagagtgttagagtgttaccctaaaccataaac 960 
9 61 tataagatttatggtggactaattttcatatatttcttattgcttttaccttttcttggtatgtaagtccgtaactggaa 1040 
1041 ttactgtgggttgccatggcactctgtggtcttttggttcatgcatggatgcttgcgcaagaaaaagacaaagaacaaag 1120 
1121 aaaaaagacaaaacagagagacaaaacgcaatcacacaaccaactcaaattagtcactggctgatcaagatcgccgcgtc 12 00 
1201 catgtatgtctaaatgccatgcaaagcaacacgtgcttaacatgcactttaaatggctcacccatctcaacccacacaca 12 80 

12 81 aacacattgcctttttcttcatcatcaccacaaccacctgtatatattcattctcttccgccacctcaatttcttcactt 13 60 

13 61 caacacacgtcaacctgcatatgcgtgtcatcccatgcccaaatctccatgcatgttccaaccaccttctctcttatata 1440 
1441 atacctataaatacctctaatatcactcacttctttcatcatccatccatccagagtactactactctactactataata 1520 

1521 ccccaacccaactcatattcaatactactctact ATG AAT GGT CTC GAA ACT CAC AAC ACA AGG CTC 1587 
1 MNGLETHNTRLll 

1588 TGT ATC GTA GGA AGT GGC CCA GCG GCA CAC ACG GCG GCG ATT TAC GCA GCT AGG GCT GAA 1647 
12CIVGSGPAAHTAAIYAARAE 31 

1648 CTT AAA CCT CTT CTC TTC GAA GGA TGG ATG GCT AAC GAC ATC GCT CCC GGT GGT CAA CTA 1707 
32LKPLLFEGWMANDIAPGGQL 51 

17 08 ACA ACC ACC ACC GAC GTC GAG AAT TTC CCC GGA TTT CCA GAA GGT ATT CTC GGA GTA GAG 1767 
52TTTTDVENFPGFPEGILGVE 71 
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1768 CTC ACT GAC AAA TTC CGT AAA CAA TCG GAG CGA TTC GGT ACT ACG ATA TTT ACA GAG ACG 182 7 
'72LTDKFRKQSERFGTTIFTET 91 

1828 GTG ACG AAA GTC GAT TTC TCT TCG AAA CCG TTT AAG CTA TTC ACA GAT TCA AAA GCC ATT 1887 
92VTKVDFSSKPFKLFTDSKAI 111 

1888 CTC GCT GAC GCT GTG ATT CTC GCT ACT GGA GCT GTG GCT AAG CGG CTT AGC TTC GTT GGA 1947 

112 LADAVILATGAVAKRLSFVG 131 

1948 TCT GGT GAA GGT TCT GGA GGT TTC TGG AAC CGT GGA ATC TCC GCT TGT GCT GTT TGC GAC 2007 

132 SGEGSGGFWNRGISACAVCD 151 

2008 GGA GCT GCT CCG ATA TTC CGT AAC AAA CCT CTT GCG GTG ATC GGT GGA GGC GAT TCA GCA 2067 

152GAAPIFRNKPLAVIGGGDSA 171 

2 068 ATG GAA GAA GCA AAC TTT CTT ACA AAA TAT GGA TCT AAA GTG TAT ATA ATC CAT AGG AGA 212 7 

172MEEANFLTKYGSKVYIIHRR 191 

212 8 GAT GCT TTT AGA GCG TCT AAG ATT ATG CAG CAG CGA GCT TTG TCT AAT CCT AAG ATT GAT 2187 

192 DAFRASKIMQQRALSNPKID 211 

2188 GTG ATT TGG AAC TCG TCT GTT GTG GAA GCT TAT GGA GAT GGA GAA AGA GAT GTG CTT GGA 2247 

212 VIWNSSVVEAYGDGERDVLG 231 

2 248 GGA TTG AAA GTG AAG AAT GTG GTT ACC GGA GAT GTT TCT GAT TTA AAA GTT TCT GGA TTG 2307 

232 GLKVKNVVTGDVSDLKVSGL 251 

230 8 TTC TTT GCT ATT GGT CAT GAG CCA GCT ACC AAG TTT TTG GAT GGT GGT GTT GAG TTA GAT 23 67 

252 FFAIGHEPATKFLDGGVELD 271 

2368 TCG GAT GGT TAT GTT GTC ACG AAG CCT GGT ACT ACA CAG ACT AGC GTT CCC GGA GTT TTC 2427 

272 SDGYVVTKPGTTQTSVPGVF 291 

2428 GCT GCG GGT GAT GTT CAG GAT AAG AAG TAT AGG CAA GCC ATC ACT GCT GCA GGA ACT GGG 2487 

292 AAGDVQDKKYRQAITAAGTG 311 

2488 TGC ATG GCA GCT TTG GAT GCA GAG CAT TAC TTA CAA GAG ATT GGA TCT CAG CAA GGT AAG 2547 

312CMAALDAEHYLQEIGSQQGK 331 

2548 AGT GAT TGA age ttaataagtatgaac taaaatgcatgtaggtgtaagagc tcatggagagcatggaatattgtatc 2 624 

332 S D * Hindlll 334 

262 5 cgaccatgtaacagtataataactgagctccatctcacttcttctatgaataaacaaaggatgttatgatatattaacac 27 04 

2705 tctatctatgcaccttattgttctatgataaatttcctcttattattataaatcatctgaatcgtgacggcttatggaat 27 84 

2785 gcttcaaatagtacaaaaacaaatgtgtactataagactttctaaacaattctaactttagcattgtgaacgagacataa 2864 



2865 gtgttaagaagacataacaattataatggaagaagtttgtctccatttatatattatatattacccacttatgtattata 2944 
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294 5 ttaggatgttaaggagacataacaattataaagagagaagtttgtatccatttatatattatatactacccatttatata 3024 

3 02 5 ttatacttatccacttatttaatgtctttataaggtttgatccatgatatttctaatattttagttgatatgtatatgaa 3104 

3105 agggtactatttgaactctcttactctgtataaaggttggatcatccttaaagtgggtctatttaattttattgcttctt 3184 

3185 acagataaaaaaaaaattatgagttggtttgataaaatattgaaggatttaaaataataataaataataaataacatata 3264 

32 65 atatatgtatataaatttattataatataacatttatctataaaaaagtaaatattgtcataaatctatacaatcgttta 3344 

3 34 5 gccttgctggacgactctcaattatttaaacgagagtaaacatatttgactttttggttatttaacaaattattatttaa 3424 

3425 cactatatgaaattttttttttttatcggcaaggaaataaaattaaattaggagggacaatggtgtgtcccaatccttat 35 04 

3505 acaaccaacttccacaggaaggtcaggtcggggacaacaaaaaaacaggcaagggaaattttttaatttgggttgtcttg 35 84 

3 585 tttgctgcataatttatgcagtaaaacactacacataacccttttagcagtagagcaatggttgaccgtgtgcttagctt 3664 

3 665 cttttattttatttttttatcagcaaagaataaataaaataaaatgagacacttcagggatgtttcaacccttatacaaa 3 744 

3745 accccaaaaacaagtttcctagcaccctaccaacta aggtacc 3787 
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FIGURE 16 

PstI 

1 ctqcag gaattcattgtactcccagtatcattatagtgaaagttttggctctctcgccggtggttttttacctctattta 8 0 
81 aaggggttttccacctaaaaattctggtatcattctcactttacttgttactttaatttctcataatctttggttgaaat 160 
161 tatcacgcttccgcacacgatatccctacaaatttattatttgttaaacattttcaaaccgcataaaattttatgaagtc 240 
241 ccgtctatctttaatgtagtctaacattttcatattgaaatatataatttacttaattttagcgttggtagaaagcataa 32 0 
321 tgatttattcttattcttcttcatataaatgtttaatatacaatataaacaaattctttaccttaagaaggatttcccat 400 
401 tttatattttaaaaatatatttatcaaatatttttcaaccacgtaaatctcataataataagttgtttcaaaagtaataa 480 

4 81 aatttaactccataatttttttattcgactgatcttaaagcaacacccagtgacacaactagccatttttttctttgaat 56 0 

5 61 aaaaaaatccaattatcattgtattttttttatacaatgaaaatttcaccaaacaatcatttgtggtatttctgaagcaa 64 0 
641 gtcatgttatgcaaaattctataattcccatttgacactacggaagtaactgaagatctgcttttacatgcgagacacat 72 0 
721 cttctaaagtaattttaataatagttactatattcaagatttcatatatcaaatactcaatattacttctaaaaaattaa 80 0 
801 ttagatataattaaaatattacttttttaattttaagtttaattgttgaatttgtgactattgatttattattctactat 880 
881 gtttaaattgttttatagatagtttaaagtaaatataagtaatgtagtagagtgttagagtgttaccctaaaccataaac 96 0 
961 tataagatttatggtggactaattttcatatatttcttattgcttttaccttttcttggtatgtaagtccgtaactggaa 1040 

1041 ttactgtgggttgccatggcactctgtggtcttttggttcatgcatggatgcttgcgcaagaaaaagacaaagaacaaag 1120 
1121 aaaaaagacaaaacagagagacaaaacgcaatcacacaaccaactcaaattagtcactggctgatcaagatcgccgcgtc 1200 
1201 catgtatgtctaaatgccatgcaaagcaacacgtgcttaacatgcactttaaatggctcacccatctcaacccacacaca 12 80 

12 81 aacacattgcctttttcttcatcatcaccacaaccacctgtatatattcattctcttccgccacctcaatttcttcactt 13 60 

13 61 caacacacgtcaacctgcatatgcgtgtcatcccatgcccaaatctccatgcatgttccaaccaccttctctcttatata 1440 
1441 atacctataaatacctctaatatcactcacttctttcatcatccatccatccagagtactactactctactactataata 1520 

1521 ccccaacccaac teat attcaatactactc tact ATG GCG GAT ACA GOT AGA GGA AGO CAT CAC GAT 1587 
1 MADTARGTHHDll 

1588 ATC ATC GGC AGA GAC CAG TAG CCG ATG ATG GGC CGA GAG CGA GAG GAG TAG GAG ATG TCC 1647 
12IIGRDQYPMMGRDRDQYQMS 31 

1648 GGA CGA GGA TCT GAC TAG TCC AAG TCT AGG CAG ATT GCT AAA GCT GCA ACT GCT GTC ACA 1707 
32GRGSDYSKSRQIAKAATAVT 51 

1708 GCT GGT GGT TCC CTC CTT GTT CTC TCC AGC CTT ACC CTT GTT GGA ACT GTC ATA GCT TTG 1767 
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52AGGSLLVLSSLTLVGTVIAL 71 

1768 ACT GTT GCA ACA CCT CTG CTC GTT ATC TTC AGC CCA ATC CTT GTC CCG GCT CTC ATC ACA 1827 

72TVATPLLVIFSPILVPALIT 91 

182 8 GTT GCA CTC CTC ATC ACC GGT TTT CTT TCC TCT GGA GGG TTT GGC ATT GCC GCT ATA ACC 1887 

92VALLITGFLSSGGFGIAAIT 111 

1888 GTT TTC TCT TGG ATT TAC AA gtaagcacacatttatcatcttacttcataattttgtffcaatatgtgcatgca 1960 

112 V F S W I Y K 118 

1961 tgtgttgagccagtagctttggatcaatttttttggtcgaataacaaatgtaacaataagaaattgcaaattctagggaa 2040 

2041 catttggttaactaaatacgaaatttgacctagctagcttgaatgtgtctgtgtatatcatctatataggtaaaatgctt 2120 

2121 ggtatgatacctattgattgtgaatag G TAC GCA ACG GGA GAG CAC CCA CAG GGA TCA GAC AAG 2184 

119 YATGEHPQGSDK 130 

2185 TTG GAC AGT GCA AGG ATG AAG TTG GGA AGC AAA GCT CAG GAT CTG AAA GAC AGA GCT CAG 2244 

131 LDSARMKLGSKAQDLKDRAQ 150 

2245 TAC TAC GGA CAG CAA CAT ACT GGT GGG GAA CAT GAC CGT GAC CGT ACT CGT GGT GGC CAG 23 04 

151 YYGQQHTGGEHDRDRTRGGQ 170 

23 05 CAC ACT ACC ATG AAT GGT CTC GAA ACT CAC AAC ACA AGG CTC TGT ATC GTA GGA AGT GGC 2364 

171 HTTMNGLETHNTRLCIVGSG 190 

23 65 CCA GCG GCA CAC ACG GCG GCG ATT TAC GCA GCT AGG GCT GAA CTT AAA CCT CTT CTC TTC 2424 

191 PAAHTAAIYAARAELKPLLF 210 

2425 GAA GGA TGG ATG GCT AAC GAC ATC GCT CCC GGT GGT CAA CTA ACA ACC ACC ACC GAC GTC 2484 

211 EGWMANDIAPGGQLTTTTDV 230 

2485 GAG AAT TTC CCC GGA TTT CCA GAA GGT ATT CTC GGA GTA GAG CTC ACT GAC AAA TTC CGT 2 544 

231 ENFPGFPEGILGVELTDKFR 250 

2545 AAA CAA TCG GAG CGA TTC GGT ACT ACG ATA TTT ACA GAG ACG GTG ACG AAA GTC GAT TTC 2604 

251 KQSERFGTTIFTETVTKVDF 270 

2605 TCT TCG AAA CCG TTT AAG CTA TTC ACA GAT TCA AAA GCC ATT CTC GCT GAC GCT GTG ATT 2 664 

271 SSKPFKLFTDSKAILADAVI 290 

2 665 CTC GCT ACT GGA GCT GTG GCT AAG CGG CTT AGC TTC GTT GGA TCT GGT GAA GGT TCT GGA 2724 

291 LATGAVAKRLSFVGSGEGSG 310 

2725 GGT TTC TGG AAC CGT GGA ATC TCC GCT TGT GCT GTT TGC GAC GGA GCT GCT CCG ATA TTC 2784 

311 GFWNRGISACAVCDGAAPIF 330 

2785 CGT AAC AAA CCT CTT GCG GTG ATC GGT GGA GGC GAT TCA GCA ATG GAA GAA GCA AAC TTT 2 844 

331 RNKPLAVIGGGDSAMEEANF 350 
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2 845 CTT AC A AAA TAT GGA TOT AAA GTG TAT ATA ATC CAT AGG AGA GAT GCT TTT AGA GCG TOT 2904 
351LTKYGSKVYIIHRRDAFRAS 370 

2905 AAG ATT ATG CAG CAG CGA GCT TTG TCT AAT CCT AAG ATT GAT GTG ATT TGG AAC TCG TCT 2964 
371 KIMQQRALSNPKIDVIWNSS 390 

2 965 GTT GTG GAA GCT TAT GGA GAT GGA GAA AGA GAT GTG CTT GGA GGA TTG AAA GTG AAG AAT 3024 
391 VVEAYGDGERDVLGGLKVKN 410 

3 025 GTG GTT ACC GGA GAT GTT TCT GAT TTA AAA GTT TCT GGA TTG TTG TTT GCT ATT GGT CAT 3 084 
411VVTGDVSDLKVSGLFFAIGH 430 

3 085 GAG CCA GCT ACC AAG TTT TTG GAT GGT GGT GTT GAG TTA GAT TCG GAT GGT TAT GTT GTC 3144 
431 EPATKFLDGGVELDSDGYVV 450 

3145 ACG AAG CCT GGT ACT ACA CAG ACT AGC GTT CCC GGA GTT TTC GCT GCG GGT GAT GTT CAG 3204 
451 TKPGTTQTSVPGVFAAGDVQ 470 

3205 GAT AAG AAG TAT AGG CAA GCC ATC ACT GCT GCA GGA ACT GGG TGC ATG GCA GCT TTG GAT 3264 
471 DKKYRQAITAAGTGCMAALD 490 

3265 GCA GAG CAT TAC TTA CAA GAG ATT GGA TCT CAG CAA GGT AAG AGT GAT T GA agctt aataaat 3327 
491 AEHYLQEIGSQQGKSD* Hindlll 507 

3 328 atgaactaaaatgcatgtaggtgtaagagctcatggagagcatggaatattgtatccgaccatgtaacagtataataact 34 07 

340 8 gagctccatctcacttcttctatgaataaacaaaggatgttatgatatattaacactctatctatgcaccttattgttct 3 487 

348 8 atgataaatttcctcttattattataaatcatctgaatcgtgacggcttatggaatgcttcaaatagtacaaaaacaaat 3 567 

3 568 gtgtactataagactttctaaacaattctaactttagcattgtgaacgagacataagtgttaagaagacataacaattat 3 647 

3 64 8 aatggaagaagtttgtctccatttatatattatatattacccacttatgtattatattaggatgttaaggagacataaca 3 727 

372 8 attataaagagagaagtttgtatccatttatatattatatactacccatttatatattatacttatccacttatttaatg 3807 

3 808 tctttataaggtttgatccatgatatttctaatattttagttgatatgtatatgaaagggtactatttgaactctcttac 3 887 

3 888 tctgtataaaggttggatcatccttaaagtgggtctatttaattttattgcttcttacagataaaaaaaaaattatgagt 3 9 67 

3 968 tggtttgataaaatattgaaggatttaaaataataataaataataaataacatataatatatgtatataaatttattata 4047 

404 8 atataacatttatctataaaaaagtaaatattgtcataaatctatacaatcgtttagccttgctggacgactctcaatta 4127 

412 8 tttaaacgagagtaaacatatttgactttttggttatttaacaaattattatttaacactatatgaaatttttttttttt 4207 

4208 atcggcaaggaaataaaattaaattaggagggacaatggtgtgtcccaatccttatacaaccaacttccacaggaaggtc 42 87 
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4288 aggtcggggacaacaaaaaaacaggcaagggaaattttttaatttgggttgtcttgtttgctgcataatttatgcagtaa 4367 

43 68 aacactacacataacccttttagcagtagagcaatggttgaccgtgtgcttagcttcttttattttatttttttatcagc 4447 

444 8 aaagaataaataaaataaaatgagacacttcagggatgtttcaacccttatacaaaaccccaaaaacaagtttcctagca 4527 

4528 ccctaccaactaa aatacc 4546 
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FIGURE 17 

PstI 

1 ctacagigaattcattgtactcccagtatcattatagtgaaagttttggctctctcgccggtggttttttacctctattta 80 

81 aaggggttttccacctaaaaattctggtatcattctcactttacttgttactttaatttctcataatctttggttgaaat 160 

161 tatcacgcttccgcacacgatatccctacaaatttattatttgttaaacattttcaaaccgcataaaattttatgaagtc 240 

241 ccgtctatctttaatgtagtctaacattttcatattgaaatatataatttacttaattttagcgttggtagaaagcataa 320 

321 tgatttattcttattcttcttcatataaatgtttaatatacaatataaacaaattctttaccttaagaaggatttcccat 400 

4 01 tttatattttaaaaatatatttatcaaatatttttcaaccacgtaaatctcataataataagttgtttcaaaagtaataa 4 80 

4 81 aatttaactccataatttttttattcgactgatcttaaagcaacacccagtgacacaactagccatttttttctttgaat 5 60 

5 61 aaaaaaatccaattatcattgtattttttttatacaatgaaaatttcaccaaacaatcatttgtggtatttctgaagcaa 640 
641 gtcatgttatgcaaaattctataattcccatttgacactacggaagtaactgaagatctgcttttacatgcgagacacat 720 
721 cttctaaagtaattttaataatagttactatattcaagatttcatatatcaaatactcaatattacttctaaaaaattaa 800 
801 ttagatataattaaaatattacttttttaattttaagtttaattgttgaatttgtgactattgatttattattctactat 880 
881 gtttaaattgttttatagatagtttaaagtaaatataagtaatgtagtagagtgttagagtgttaccctaaaccataaac 960 
9 61 tataagatttatggtggactaattttcatatatttcttattgcttttaccttttcttggtatgtaagtccgtaactggaa 1040 

1041 ttactgtgggttgccatggcactctgtggtcttttggttcatgcatggatgcttgcgcaagaaaaagacaaagaacaaag 1120 

1121 aaaaaagacaaaacagagagacaaaacgcaatcacacaaccaactcaaattagtcactggctgatcaagatcgccgcgtc 12 00 

12 01 catgtatgtctaaatgccatgcaaagcaacacgtgcttaacatgcactttaaatggctcacccatctcaacccacacaca 12 80 

12 81 aacacattgcctttttcttcatcatcaccacaaccacctgtatatattcattctcttccgccacctcaatttcttcactt 13 60 

1361 caacacacgtcaacctgcatatgcgtgtcatcccatgcccaaatctccatgcatgttccaaccaccttctctcttatata 1440 

1441 atacctataaatacctctaatatcactcacttctttcatcatccatccatccagagtactactactctactactataata 152 0 

1521 ccccaacccaactcatattcaatactactctact ATG AAT GGT CTC GAA ACT CAC AAC ACA AGG CTC 1587 
1 MNGLETHNTRLll 

1588 TGT ATC GTA GGA AGT GGC CCA GCG GCA CAC ACG GCG GCG ATT TAC GCA GCT AGG GCT GAA 1647 
12CIVGSGPAAHTAAIYAARAE 31 

1648 CTT AAA CCT CTT CTC TTC GAA GGA TGG ATG GCT AAC GAC ATC GCT CCC GGT GGT CAA CTA 1707 
32LKPLLFEGWMANDIAPGGQL 51 

1708 ACA ACC ACC ACC GAC GTC GAG AAT TTC CCC GGA TTT CCA GAA GGT ATT CTC GGA GTA GAG 1767 
52TTTTDVENFPGFPEGILGVE 71 
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1768 CTC ACT GAC AAA TTC CGT AAA CAA TCG GAG CGA TTC GGT ACT ACG ATA TTT ACA GAG ACG 1827 
72LTDKFRKQSERFGTTIFTET 91 

1828 GTG ACG AAA GTC GAT TTC TCT TCG AAA CCG TTT AAG CTA TTC ACA GAT TCA AAA GCC ATT 1887 
92VTKVDF S SKPFKLFTDSKAI 111 

1888 CTC GCT GAC GCT GTG ATT CTC GCT ACT GGA GCT GTG GCT AAG CGG CTT AGC TTC GTT GGA 1947 

112 LADAVILATGAVAKRLSFVG 131 

1948 TCT GGT GAA GGT TCT GGA GGT TTC TGG AAC CGT GGA ATC TCC GCT TGT GCT GTT TGC GAC 2 007 

132SGEGSGGFWNRGISACAVCD 151 

2008 GGA GCT GCT CCG ATA TTC CGT AAC AAA CCT CTT GCG GTG ATC GGT GGA GGC GAT TCA GCA 2067 

152 GAAPIFRNKPLAVIGGGDSA 171 

2 068 ATG GAA GAA GCA AAC TTT CTT ACA AAA TAT GGA TCT AAA GTG TAT ATA ATC CAT AGG AG A 2127 

172 MEEANFLTKYGSKVYI IHRR 191 

2128 GAT GCT TTT AGA GCG TCT AAG ATT ATG CAG CAG CGA GCT TTG TCT AAT CCT AAG ATT GAT 2187 

192 DAFRASKIMQQRALSNPKID 211 

2188 GTG ATT TGG AAC TCG TCT GTT GTG GAA GCT TAT GGA GAT GGA GAA AGA GAT GTG CTT GGA 2247 

212 VIWNSSVVEAYGDGERDVLG 231 

2248 GGA TTG AAA GTG AAG AAT GTG GTT ACC GGA GAT GTT TCT GAT TTA AAA GTT TCT GGA TTG 2307 

232 GLKVKNVVTGDVSDLKVSGL 251 

2308 TTC TTT GCT ATT GGT CAT GAG CCA GCT ACC AAG TTT TTG GAT GGT GGT GTT GAG TTA GAT 23 67 

252 FFAIGHEPATKFLDGGVELD 271 

2368 TCG GAT GGT TAT GTT GTC ACG AAG CCT GGT ACT ACA CAG ACT AGC GTT CCC GGA GTT TTC 2427 

272 SDGYVVTKPGTTQTSVPGVF 291 

242 8 GCT GCG GGT GAT GTT CAG GAT AAG AAG TAT AGG CAA GCC ATC ACT GCT GCA GGA ACT GGG 2487 

292 AAGDVQDKKYRQAITAAGTG 311 

2488 TGC ATG GCA GCT TTG GAT GCA GAG CAT TAC TTA CAA GAG ATT GGA TCT CAG CAA GGT AAG 2547 

312 CMAALDAEHYLQEIGSQQGK 331 

2548 AGT GAT ATG GCG GAT ACA GCT AGA GGA ACC CAT CAC GAT ATC ATC GGC AGA GAC CAG TAC 2607 

332 SDMADTARGTHHDI IGRDQY 351 

2608 CCG ATG ATG GGC CGA GAC CGA GAC CAG TAC CAG ATG TCC GGA CGA GGA TCT GAC TAC TCC 2 667 

352 PMMGRDRDQYQMSGRGSDYS 371 

2 668 AAG TCT AGG CAG ATT GCT AAA GCT GCA ACT GCT GTC ACA GCT GGT GGT TCC CTC CTT GTT 272 7 

372 KSRQIAKAATAVTAGGSLLV 391 
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272 8 CTC TCC AGC CTT ACC CTT GTT GGA ACT GTC ATA GCT TTG ACT GTT GCA ACA CCT CTG CTC 2787 

392 LSSLTLVGTVIALTVATPLL 411 

27 88 GTT ATC TTC AGC CCA ATC CTT GTC CCG GCT CTC ATC ACA GTT GCA CTC CTC ATC ACC GGT 2847 

412 VIFSPILVPALITVALLITG 431 

2848 TTT CTT TCC TCT GGA GGG TTT GGC ATT GCC GCT ATA ACC GTT TTC TCT TGG ATT TAC AA g 2 907 

432 FLSSGGFGIAAITVFSWIYK 451 

2 908 taagcacacatttatcatcttacttcata.a.ttttg-tgca.atatgtgca.tgcatg'tgt tgagccagtagctttggatcaat 2 9 87 
2988 ttttt tggtcgaa taacaaa tgtaacaa taagaaa t tgcaaa t tctagggaaca 1 1 tggt taactaaa tacgaaa 1 1 tga 3067 

3 068 cctagctagcttgaatgtgtctgtgtatatcatctatataggtaaaatgcttggtatgatacctattgattgtgaatag 3146 

3147 G TAC GCA ACG GGA GAG CAC CCA CAG GGA TCA GAC AAG TTG GAC AGT GCA AGG ATG AAG 3204 
452 YATGEHPQGSDK 

3 2 05 TTG GGA AGC AAA GCT CAG GAT CTG AAA GAC AGA GCT 
471 LGSKAQDLKDRA 

32 65 GGT GGG GAA CAT GAC CGT GAC CGT ACT CGT GGT GGC 
491 GGEHDRDRTRGG 

3328 tgaactaaaatgcatgtaggtgtaagagctcatggagagcatggaatattgtatccgaccatgtaacagtataataactg 3407 

3 408 agctccatctcacttcttctatgaataaacaaaggatgttatgatatattaacactctatctatgcaccttattgttcta 3487 

3488 tgataaatttcctcttattattataaatcatctgaatcgtgacggcttatggaatgcttcaaatagtacaaaaacaaatg 3567 

3568 tgtactataagactttctaaacaattctaactttagcattgtgaacgagacataagtgttaagaagacataacaattata 3647 

3 64 8 atggaagaagtttgtctccatttatatattatatattacccacttatgtattatattaggatgttaaggagacataacaa 3 727 

372 8 ttataaagagagaagtttgtatccatttatatattatatactacccatttatatattatacttatccacttatttaatgt 3 807 

3 808 ctttataaggtttgatccatgatatttctaatattttagttgatatgtatatgaaagggtactatttgaactctcttact 3 887 

3 888 ctgtataaaggttggatcatccttaaagtgggtctatttaattttattgcttcttacagataaaaaaaaaattatgagtt 39 67 
396 8 ggtttgataaaatattgaaggatttaaaataataataaataataaataacatataatatatgtatataaatttattataa 4 047 

4 04 8 tataacatttatctataaaaaagtaaatattgtcataaatctatacaatcgtttagccttgctggacgactctcaattat 4127 
412 8 ttaaacgagagtaaacatatttgactttttggttatttaacaaattattatttaacactatatgaaatttttttttttta 42 07 
420 8 tcggcaaggaaataaaattaaattaggagggacaatggtgtgtcccaatccttatacaaccaacttccacaggaaggtca 42 87 



L D S A R M K 470 

CAG TAC TAC GGA CAG CAA CAT ACT 3264 

QYYGQQHT 490 

CAG CAC ACT ACT TAA actt aataaata 3327 

Q H T T * Hindlll 507 
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42 8 8 ggtcggggacaacaaaaaaacaggcaagggaaattttttaatttgggttgtcttgtttgctgcataatttatgcagtaaa 43 67 

43 68 acactacacataacccttttagcagtagagcaatggttgaccgtgtgcttagcttcttttattttatttttttatcagca 4447 
444 8 aagaataaataaaataaaatgagacacttcagggatgtttcaacccttatacaaaaccccaaaaacaagtttcctagcac 4527 

4528 cctaccaacta aaatacc 4545 

Kpnl 
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